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(54) Verfahren zur Herstellung von naturiich gefalteten und sekretierten Proteinen 



(57) Ein Verfahren zur Herstellung eines wasserlos- 
lichen, naturiich gefalteten eukaryontischen Polypep- 
tids, enthaltend zwei Oder mehrere uber Disulfidbrucken 
verknupfte Cysteine, durch Kultivierung prokaryonti- 
scher Zellen, a) wobei die genannten prokaryontischen 
Zellen einen Expressionsvektor enthalten, der fur das 
genannte Polypeptid, das am N-Terminus eine proka- 
ryontische Signalsequenz enthalt, codiert, b) unter Be- 
dingungen, bei denen das Polypeptid in das Periplasma 
Oder das Medium sekretiert wird, c) Abspaltung der Si- 



gnalsequenz und Isolierung des Polypeptids aus dem 
Periplasma oder dem Medium, dadurch gekennzetch- 
net, daG die Kultivierung in Gegenwarl von Arginin oder 
einer Verbindung der allgemeinen Formel I F^-CO- 
NRR., (I) erfolgt, wobei R und R 1 Wasserstoff oder eine 
gesattigte oder ungesattigte verzweigte oder unver- 
zweigte C t - C 4 -Alkylkette und R 2 Wasserstoff, NHRt 
oder eine gesattigte oder ungesattigte verzweigte oder 
unverzweigte - C 3 -Alkylkette darstellen, ist zur re- 
kombinanten Herstellung von Polypeptiden in Proka- 
ryonten mit hoher Ausbeute geeignet. 
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Beschr ibung 

[0001 ] Die Erfindung betrifft ein Verfahren zur Herstellung von wasserlosiichen, naturlich gefaltelen und sekretrierten 
Polypeptiden nach Expression in prokaryontischen Zellen. 

[0002] In prokaryontischen Organismen findet die Proteinsynthese, auch Translation genannt, an den Ribosomen 
im Cytoplasma statt. Bei einer Expression rekombinanter DNA in prokaryontischen Wirtsorganismen ist es oft wun- 
schenswert, daB das dabei erhaltene rekombinante Genprodukt bzw. Protein aus dem Cytoplasma durch die innere 
bakterielle Membran in den periplasmatischen Raum zwischen innerer und auBerer Membran sekretiert wird. Vom 
Periplasma konnen sekretierte Proteine dann z.B. durch einen osmotischen Schock in das Nahrmedium freigesetzt 
werden. Ein Nachteil dieses Verfahrens ist, daB die sezernierten Polypeptide haufig nicht die native, biologisch aktive 
Konformation ausbilden (Hockney, TIBTECH 12 (1994) 456 - 463). 

[0003] In jungster Zett wurden molekulare Chaperone und Faltungskatalysatoren, wie Peptidyl-Prolyl-cis/trans-lso- 
merasen oder Proteindisulfidisomerasen (Glockshuber et al., EP-A 0 510 658) eingesetzt, um die Ausbeute an nativem 
rekombinanten Protein bei der Faltung in vivo zu erhohen (Thomas et al., Appl. Biochem. BiotechnoL 66 (1997) 
197-238). Dies fuhrte teilweise zu erheblichen Verbesserungen bei der Expression z.B. von Ribulosebisphosphat- 
Carboxylase (RUBISCO; Goloubinoff et al., Nature 337 (1989) 44-47), humaner Procollagenase (Lee & Olins, J. Biol. 
Chem. 267 (1 992) 2849-2852) Oder neuronater Stickstoffoxidsynthase aus Ratten (Roman et al., Proc. Natl. Acad. Sci. 
USA 92 (1 995) 8428-8432). In diesen Beispielen wurden GroEL/ES bzw. das DnaK-System aus E. coli im Cytosol co- 
uberexprimiert. Der positive Effekt liegt dabei meist in einer erhohten Anreicherung des gewunschten Proteins in 16s- 
20 licher Form. 

[0004] Auch bei der Sekretion rekombinanter Proteine ins Periplasma von E. coli wurde die Co-Expression von 
Chaperone untersucht. Hier wurde jedoch nur eine cytosolische Oberexpression von Chaperone erprobt, um die Se- 
kretion ins Periplasma zu optimieren (Perez-Perez et al., Biochem. Biophys. Res. Commun. 210 (1995) 524-529; Sato 
et aL Biochem. Biophys. Res. Commun. 202 (1 994) 258-264; Berges et al., Appl. Environ. Microbiol. 52 (1 996) 55-60). 
Bisherige Versuche zur Co-Sekretion in E. coli betrafen nur Faltungshelfer-Proteine, wie z. B. Proteindisulftdisomerase 
(PDI; Glockshuber et al., EP-A 0 510 658) oder Peptidyl-Prolyl-cis/trans-lsomerasen oder Dsb-Proteine (Knappik et 
al., Bio/Technology 11(1993) 77-83; Qiu et al., Appl. Environm. Microbiol. 64 (1998) 4891-4896 und Schmidt et al 
Prot. Engin. 11 (1998) 601 - 607. 

[0005] Verbindungen wie Harnstoff oder Harnstoffderivate, Formamid, Acetamid oder L-Arginin werden bei Vertahren 
zur in vitro Renaturierung von unloslichen Proteinaggregaten (Inclusion bodies - EinschluBkorper) eingesetzt, die bei 
der cyioplasmatischen Expression von rekombinanter DNA in prokaryontischen Zellen entstehen. L-Arginin kann als 
Zusatz bei der Renaturierung in vitro die Ausbeute an nativ gefalteten Proteinen erheblich verbessern (Rudolph et al , 
US-Patent Nr. 5,593,865; Buchner & Rudolph, Biotechnology 9 (1991)157-162; Brinkmann et al Proc Natl Acad 
Sci USA 89 (1992) 3075-3079; Lin & Traugfv Prot. Express. Purif. 4 (1993) 256-264). 

[0006] Aufgabe der Erfindung ist es, ein Verfahren zur Herstellung von wasserlosiichen, naturlich gefalteten euka- 
ryontischen Polypeptiden nach Expression in Prokaryonten zur Verfugung zu stellen, welches auf einfache Weise 
durchf uhrbar ist und bei dem eine aufwendige in vitro-Nachbehandlung, wie Auflosung von inclusion bodies, Reduktion 
und Naturierung, nicht erforderlich ist. 

[0007] Die Aufgabe wird gelost durch ein Verfahren zur Herstellung eines wasserlosiichen, naturlich gefalteten eu- 
karyontischen Polypeptids : enthaltend zwei oder mehrere uber Disulfidbrucken verknupfte Cysteine, durch Kultivierung 
prokaryontischer Zellen, 

a) wobei die genannten prokaryontischen Zellen einen Expressionsvektor enthalten, der fur das genannte Poly- 
peptid, das am N-Terminus eine prokaryontische Signalsequenz enthalt, codiert 
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b) unter Bedingungen, bei denen das Polypeptid in das Periplasma oder das Medium sekretiert wird, 

c) Abspaltung der Signalsequenz und Isolierung des Polypeptids aus dem Periplasma oder dem Medium, 
dadurch gekennzeichnet, daB die Kultivierung in Gegenwart von Arginin oder einer Verbindung der allgemeinen Formel 

R 2 -CO-NRR 1 (I) 

erfolgt, wobei 
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R und R-, Wasserstoff oder eine gesattigte oder ungesattigte verzweigte Oder unverzweigte C^C^AIkylkette und 

R 2 Wasserstoff, NHR<, oder eine gesattigte oder ungesattigte verzweigte oder unverzweigte C 1 -C 3 -Alkylkette dar- 
stellen. 

5 

[0X)08] Vorzugsweise betragt die Konzentration von Arginin oder der Verbindung der allgemeinen Formel I minde- 
stens 0 : 1 mol/l, kann aber auch deutlich hoher sein, solange die Loslichkeit von Arginin oder der genannten Verbindung 
gewahrleistet ist. Bevorzugt werden Arginin oder die Verbindungen der allgemeinen Formel I in einer Konzentration 
von 0,1 bis 1,5 mol/l verwendet. 
io [0009] Als Verbindungen der allgemeinen Formel I werden vorzugsweise Formamid, Acetamid, Harnstoff oder Harn- 
stoffderivate, wie Ethyl harnstoff oder Methylharnstoff zum Nahrmedium, welches fur die Kultivierung der prokaryonti- 
schen Zellen verwendet wird, zugesetzt. Arginin kann beispielsweise als Hydrochlorid oder als andere titrierte Form 
der Base Arginin verwendet werden. Vorzugsweise wird jedoch L-Arginin, besonders bevorzugt die Hydrochloridform 
von L-Arginin, verwendet. 

is [0010] In einer bevorzugten Ausfuhrungsform des erfindungsgemaBen Veriahrens werden dem zur Kultivierung der 
prokaryontischen Zellen verwendeten Nahrmedium (Fermentationsmedium) zusatzlich reduzierende Thiolreagenzien, 
welche SH-Gruppen enthalten, zugesetzt, wobei die Ausbeute an rekombinant gewonnenem Protein weiter erhoht 
wird. Vorzugsweise werden 0,1-15 mmol/l Thiolreagenz zugesetzt. ErfindungsgemaB ist unter dem Begriff Thiolrea- 
genz" entweder ein reduzierendes (reduziertes) Thiolreagenz mit SH-Gruppen oder ein Gemisch von reduzierenden 

20 Thiolreagenzien mit SH-Gruppen und oxidierenden Thiolreagenzien mit Disulfidgruppen zu verstehen. Bevorzugte 
Substanzen sind reduziertes Glutathion (GSH), Cystein, N-Acetylcystein, Cysteamin, p-Mercaptoethanol undahnliche 
Verbindungen. Die Thiolreagenzien konnen sowohl einzeln als auch in Gemischen verwendet werden Besonders 
geeignet sind Thiolreagenzien wie beispielsweise Glutathion (GSH), die eine einzige SH-Gruppe pro Molekul aufwei- 
sen. Thiolreagenzien wie Glutathion, sind fur die Verbesserung der Ausbeute nativ gefalteter Proteine bei der Expres- 

25 sion rekombinanter DNA in prokaryontischen Zellen bekannt (Glockshuber et al., EP-A 0 510 658). 

[0011] In einer weiteren bevorzugten Ausfuhrungsform des erfindungsgemaften Veriahrens werden zusatzlich mo- 
lekulare Chaperone uberexprimiert und cosekretiert. Unter Chaperonen gemalB der Erfindung sind Proteine zu verste- 
hen, die andere, nicht-native Proteine in vivo vor Aggregation schutzen und die Ausbildung ihrer nativen Konformation 
fordern. Molekulare Chaperone werden im Stand derTechnik eingesetzt, um Proteine zu stabilisieren und damrt vor 

30 Aggregation und Inaktivierung zu schutzen (Buchner et al. t EP-A 0 556 726 A1 ). Vorzugsweise werden ATP-unabhan- 
gige Chaperone des HSP40-Typs (Molmasse ca. 40 kDa) oder ein kleines Hitzeschockprotein (sHSP) verwendet. 
DnaJ ist ein 40 kDa Hitzeschockprotein, das im Cytoplasma von E. coli vorkommt und Teil des sogenannten 
Hsp70-Chaperonsystems ist (Bukau, B. & Horwich, A. , Cell 92 (1 998) 351-366). Zu diesem System gehoren auGerdem 
DnaK (Hsp70) und GrpE. Bestimmte Proteine werden durch das DnaK-Systern in einem ATP-abhangigen ProzeG zur 

3S nativen Konformation gefaltet (Schroder et al., EMBO J. 12 (1993) 4137-4144; Langer et al., Nature 356 (1992) 683 - 
689). Zur Ruckfaltung denaturierter Proteine benotigt dieses System zusatzlich ATP. DnaJ schutzt in Abwesenheit von 
DnaK und ATP nicht-native Proteine vor Aggregation und vermittelt einen Faltungs-kompetenten Zustand (Schroder 
et al., EMBO J. 12 (1993) 4137-4144). Weiterhin bevorzugt ist die Co-Sekretion eines N-terminalen Fragmentes von 
DnaJ, das die Aminosauren 1-108 umfaGt und im Folgenden als ,, J-Domane ,, (Kelley, TIBS 23 (1998) 222-227) be- 

40 zeichnet wird. In diesem Bereich befinden sich die J-Domane und eine G/F-reiche Domane, die Wechselwirkungen 
mit DnaK ausuben (Wall et al., J. Biol. Chem. 270 (1995) 2139-2144). Es wurde gezeigt, daB die Co-Expression von 
DnaJ im Cytosol zur Erhohung der Ausbeute an loslichem Protein fuhren kann (Yokoyama et al., Microbiol. Ferment. 
Technol. 62 (1998) 1205-1210). 

[0012] Hsp25 (z.B. aus der Maus) ist ein Vertreter der kleinen Hitzeschockproteine (Gaestel et al., Eur. J. Biochem. 

45 179 (1989) 209-213), einer Klasse von Chaperonen, die ubiquitar verbreitet ist: Die Molmasse dieser Proteine liegt 
zwischen 15 und 30 kDa. Bei Hitzeschock werden die sHsps in der Zelle stark angereichert (bis zu 1% des Gesamt- 
zellproteins - Arrigo & Landry (1994), In Morimoto (Hrsg.): The Biology of Heat Shock Proteins and Molecular Chape- 
rones, Cold Spring Harbour Press, 335-373). Wie DnaJ-Proleine besitzen sHsps die Eigenschaft, die Aggregation von 
nichtnativen Proteinen zu verhindern und diese in einem laltungskompetenten Zustand zu hatten (Jakob etal., J. Biol. 

so Chem. 268 (1993) 1517-1 520; Ehrsperger et al., EMBO J. 16 (1997)221-229). 

[0013] Der Begriff "Oberexpression" gemaB vorliegender Erfindung bedeutet eine Steigerung der Expression der 
sekretierten Proteine wie z.B. DnaJ- und Hsp25 (vorzugsweise um mindestens 100%) im Vergleich zur Expression im 
Wildtyp des jewetls verwendeten prokaryontischen Wirtsorganismus. Eine solche Oberexpression laftt sich z.B. da- 
durch erreichen, daB sich die Gene (fur das Protein, Chaperon und/oder Signalpeptid) unter Kontrolle eines starken 

55 prokaryontischen, vorzugsweise induzierbaren Expressionssignals (z.B. eines lac- oder T7-Promotors oder eines De- 
rivates davon) befinden. 

[0014] Das Sekretionskonstrukt fur die Oberexpression der Polypeptide (Proteine) samt regulatorischer Regionen 
(Promotor und Terminator) auf der rekombinanten DNA ist vorzugsweise in einen Vektor, welcher zusatzlich die in 
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Prokaryonten seltene Arginin-tRNA A ga/agg codiert integriert oder wird mit einem Vektor, welcher diese tRNA codiert, 
co-exprimiert (Brinkmann et aL , Gene 85 (1989) 109-114). Dies ermoglicht sowohl die Co-Uberexpression der jewei- 
ligen Proteine ins bakterielle Periplasma als auch die Transkription der seltenen tRNA Ar 9 AGA / AGG , was eine erhohte 
Synthese des gewunschten Proteins im bakterielten Wirtsorganismus zur Folge hat. 

[0015] Unter einer prokaryontischen Signalsequenz im Sinne der Erfindung ist ein Nukleinsaurefragment zu verste- 
hen, welches aus Prokaryonten, vorzugsweise aus gramnegativen Bakterien, abgeleitet ist und das Durchdringen von 
an das Signatpeptid gebundenen Proteinen durch die inneren bakteriellen Membranen gewahrleistet. Dadurch werden 
die Proteine im Periplasma bzw. im Zelluberstand lokaiisiert. Solche Signalsequenzen haben ublicherweise eine Lange 
von 18-30 Aminosauren und sind beispielsweise beschrieben in Murphy & Beckwith: Export of Proteins to the Cell 
Envelope in Escherichia coli und in Neidhardt et al. (Hrsg.): Escherichia coli and Salmonella, Second Edition, Vol. 1, 
ASM Press, Washington, 1996, S. 967-978. Die Abspaltung von bakteriellen Signalsequenzen kann z.B. nach einer 
Sequenz Ala-X-Ala stattfinden (von Heijne et aL, J. Mol. Biol. 184 (1985) 99-105). Die Struktur der bakteriellen Signal- 
peptidase ist beschrieben in Paetzel et al., Nature 396 (1998) 186-190. Vorzugweise werden Signalsequenzen ver- 
wendet, welche durch im Periplasma von prokaryontischen Zellen lokalisierten Proteasen vom gewunschten Protein 
wieder abgespaiten werden. Atternativ kann durch Zugabe solcher Proteasen zum Zelluberstand oder zum isolierten 
Protein die Abspaltung der Signalsequenz erfolgen. 

[0016] Mit dem erfindungsgemaGen Verfahren kann die heterologe Expression einer Vielzahl von eukaryontischen 
°roteinen wie z.B. Proteasen, Interferone, Proteinhormone, Antikorper Oder Fragmenten davon verbessert werden. 
Besondersgeeignet ist das Verfahren fur die heterologe Hersteilung von Proteinen, die im nativen Zustand mindestens 
zwei Ober eine Disulfidbrucke verknupfle Cysteine enthallen und dann, wenn sie N-terminal keine fusionierte proka- 
ryontische Signalsequenz besitzen, bei der prokaryontischen Expression als unlosliche inclusion bodies entstehen. 
Besonders geeignet ist das Verfahren fur Proteine, die mehr als 5 Disulfidbrucken in nativem Zustand enthalten. Ein 
solches Protein ist beispielsweise ein rekombinanter Plasm inogenaktivator (im folgenden rPA genannt, Martin et al., 
Cardiovasc. Drug Rev. 1 1 (1 993) 299-31 1 , US-Patent Nr. 5,223,256). rPA besitzt 9 Disulfidbrucken, die im reduzieren- 
den Cytosol von E. coli nicht ausgebildet werden. 

[0017] Dabei wird die periplasmatische Lokalisation des Proteins, und gegebenenfalls des Chaperons, durch "ope- 
rative Verknupfung" mit einem Signalpeptid zum Durchdringen innerer bakterieller Membranen gewahrleistet. 
[0018] Bei der Expression eines solchen Plasminogenaktivators stellte sich eine Konzentration von 0,4 mol/l L-Ar- 
ginin und 5 mmol/l Glutathion (bei Co-Sekretion von DnaJ, J-Domane, Hsp25 sowie ScFv) bzw. 0,4 mol/l L-Arginin 
ohne Glutathion (ohne Co-Sekretion von DnaJ) als optimal heraus. 

[0019] Zur Gewinnung des sekretorischen rPA-Proteins in funktionaler Form in E. coli wurde das Gen fur dieses 
Protein aus dem Plasmid pA27fd7 (Kohnert et al., Protein Engineering 5 (1 992) 93-1 00) mit gentechnologischen Mitteln 
an eine prokaryontische Signalsequenz gramnegativer Bakterien, beispielsweise an die Signalsequenz von Pectat- 
lyase B (PelB) von Erwinia amylovora, fusioniert. Die Genfusion wurde durch Klonierung in den Vektor pET20b(+) 
(Novagen Inc., Madison, USA) hergestellt. Damit unterliegt die Genexpression der Kontrolle des T7-Promotors. Die 
im Fusionsprotein vorhandene Signalsequenz bewirkt die Sekretion ins Periplasma. Wahrend oder nach der Sekretion 
wird die Signalsequenz durch eine in der inneren Membran lokalisierte Peptidase abgespaiten. Sezerniertes Protein 
kann dann im Periplasma fallen. Die oxidierehden Bedingungen dieses Kompartiments ermoglichen die Ausbildung 
von Disulfidbrucken. Durch den erfindungsgemaBen Zusatz von niedermolekularen faltungsverbessernden Proteinen 
und Thiolragenzien im Nahrmedium und gleichzeitiger Co-Uberexpression von DnaJ, J-Domane oder Hsp25 im Peri- 
plasma gelingt es, die Ausbeute an funktionalen Protein um menr als das 100-fache zu steigern. 
[0020] Weitere Beispiele von erfindungsgemaBen Polypeptiden sina Antikorper oder Antikorperfragmente, beispiels- 
weise ein Single-Chain F v -Fragment (ScF v , z.B. gegen das Schilddrusenstimulierende Hormon (thyroide stimulating 
hormone, TSH), ScFvs sind verkurzte Antikorper, die nur aus den variablen Abschnitten (F v ) der schweren und leichten 
Kette eines Antikorpers bestehen, die Ober einen kurzen (meist Gly 4 Ser 3 ) Linker kunstlich fusioniert sind (Hudson, 
Curr. Opin Biotechnol. 9 (1998) 395-402). ScF v s haben normalerweise die gleiche Affinitat zum Antigen wie die pa- 
ternalen Fv-Strange, konnen jedoch in E. coli uberexprimiert werden. Da sie stabilisierende tntradomanen-Disulfidbruk- 
ken besitzen, die essentiell fur die Slabilitat sind, fuhrt eine Expression im Cytosol meist zur Bildung von Inclusion 
Bodies (Ubersichtsartikel: Shibui et al., Appl. Microbiol. Biotechnol. 37 (1992) 352-357). ScF v s konnen durch Zufalls- 
mutationen und anschlieGende Phage-Display-Selektion auf Bindung gewunschter Antigene gezielt optimiert werden 
(Ubersichtsartikel: Allen et al., TIBS 20 (1995) 511-516). Durch Zugabe von 5 mM GSH und 0,4 M L-Arginin konnte 
die Ausbeute an funktionellem ScFv-TSH im Periplasma um das 10-fache und im Medienuberstand um das 40-fache 
gegenuber einer Kultivierung ohne Zusatz e verbessert werden. 

[0021] Die folgenden Beispiele, Pubiikationen, das Sequenz protocol I und die Abbildungen erlautern die Erfindung, 
deren Schutzumfang sich aus den Patentanspruchen ergibt, weiter. Die beschriebenen Verfahren sind als Beispiele 
zu verstehen, die auch noch nach Modifikationen den Gegenstand der Erfindung beschreiben. 
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Beschreibung des Sequenzprotokolls 

[0022] SEQ ID NO: 1 und 2 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-dnaJ. der fur 
das Fusionsprotein aus OmpA-Signalsequenz und DnaJ codiert, zusammen mit den regulatorischen Sequenzen (Pro- 
5 motor, Terminator), die aus piN III ompA3-dnaJ amplifiziert wurden. 

[0023] SEQ ID NO: 3 und 4 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-J-Domain, der 
fur das Fusionsprotein aus OmpA-Signalsequenz und J-Domane codiert, zusammen mit den regulatorischen Sequen- 
zen (Promotor, Terminator), die aus pIN III ompA3-dnaJ amplifiziert wurden. 

[0024] SEQ ID NO: 5 und 6 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-hsp25, der fur 
to das Fusionsprotein aus OmpA-Signalsequenz und Hsp25 codiert, zusammen mit den regulatorischen Sequenzen (Pro- 
motor, Terminator), die aus pIN III ompA3-hsp25 amplifiziert wurden. 

[0025] SEQ ID NO: 7 und 8 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-ScFvOx, der fur das 
Fusionsprotein aus PelB-Signalsequenz und ScFvOxazolon codiert, zusammen mit den regulatorischen Sequenzen 
(Promotor, Terminator), die aus pHEN-ScFv bzw. pIN ill ompA3 amplifiziert wurden. 
15 [0026] SEQ ID NO: 9 und 10 zeigen die Sequenz des Teils des Expressionsplasmides pET20b(+)-rPA, der fur das 
Fusionsprotein aus PelB-Signalsequenz und rPA codiert. 

Beschreibung der Figuren 

20 [0027] Fig. 1 zeigt die Abhangigkeit der Expression von nalivem rPA im Periplasma von E. coll bei 5 mM GSH in 
Abhangigkeit von der L-Argininkonzentration und verschiedener Co-Sekretionskonstrukte. 

[0028] Fig. 2 zeigt einen Vergleich der Expression von rPA im Periplasma von E. colt BL21 (DE 3) bei Co-Sekretion 

von DnaJ undbeiZusatz von GSH und verschiedenen niedermolekularenfaltungsverbessernden Stoffenzum Medium. 

[0029] Fig. 3 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-dnaJ. 
2S [0030] Fig. 4 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-J-Domain. 

[0031] Fig. 5 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-hsp25. 

[0032] Fig. 6 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-ScFvOx. 

[0033] Fig. 7 zeigt eine schematische Darstellung des Expressionsplasmides pET20b(+)-rPA. 

[0034] Fig. 8 zeigt die Abhangigkeit der Expression von f unktionellem ScFv-TSH von der Konzentration von L-Arginin 
30 und GSH im Kulturmedium. 

[0035] (Werte wurden als relative Mengen bezuglich der Probe ohne Medienzusatze (:1 ) berechnet.) 

[0036] Fig. 9 zeigt die Abhangigkeit der Expression von funktionellem ScFv-TSH von der Konzentration von L-Arginin 

und GSH im Periplasma von E. coll 

[0037] (Werte wurden als relative Mengen bezuglich der Probe ohne Medienzusatze (:1) berechnet.) 
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AUgemeines: 



[0038] Zur periplasmatischen Uberexpression von DnaJ, der J-Domane sowie Hsp25 in E. coli wurde die DNA, die 
fur diese Proteine codiert, mit gentechnologischen Mitteln an die Signalsequenz des Outer Membrane Proteins A 
40 (OmpA) von E. coli fusioniert und die Fusion auf einem rekombinanten Plasmid unter Kontrolle des lac-lpp-Promotors 
in E. coli exprimiert. Somit werden die Polypeptidkette von DnaJ und Hsp25 ins Periplasma des prokaryontischen 
Wirt sorgan ism us transport iert und dort nativ gefaltet. Die Lokalisation und native Faltung konnte dabei durch limitierte 
Proteolyse mit Trypsin und Western Blot nachgewiesen werden. 

45 Beispiel 1 : 

Konstruktion des Expressionsplasmides pIN III omp A3-dnaJ 

[0039] Molekulargenetische Techniken beruhten auf Ausubel et al. (Hrsg.), J. Wiley & Sons, 1997, Curr. Protocols 
50 of Molecular Biology. Oligonucleotide wurden von den Firmen MWG Biotech, Ebersberg oder GIBCO Life Sciences, 
Eggenstein, DE bezogen. 

[0040] Das Gen, das fur DnaJ codiert, Gene Bank Accession No. M 1 2565, wurde Ober die Restriktionsschnittstellen 
EcoRI und BamHI in das Expressionsplasmid pIN III ompA3 (Ghayreb et al., EMBO J. 3 (1964) 2437-2442) kloniert. 
Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
55 MWG Biotech, Ebersberg) uberpruft. Das resultierende Plasmid wurde pi N III ompA3-dnaJ bezeichnet. Die Sequenz 
des periplasmatisch exprimierten DnaJ unterscheidet sich von dem Wildtyp-Protein dahingehend, daG die Polypep- 
tidsequenz mit Gly-lle-Pro beginnt statt mit Met, es fand somit eine Verlangerung des N-Terminus urn 2 Aminosauren 
statt. DnaJ befindet sich damit unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-p-D-Thiogalactosid) 
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induziert wird. 
Beispiel 2 : 

s Konstruktion des Expressionsplasmid s pUBS520-p!N-dnaJ 

[0041] Mittels PCR wurde der Bereich ausdem PlasmidpIN III ompA3-dnaJ amplifiziert, derfurdas lac-lpp Operon, 
die Signalsequenz, das dnaJ-Gen und die Terminator-Region des Operons codiert (SEQ I D NO: 1 ). Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
to risierten Vektor pUBS520 kloniett Das resultierende Plasmid wurde pUBS520-plN-dnaJ bezeichnet (Fig. 3). 

Beispiel 3: 

Konstruktion des Expressionsplasmides pUBS 520-plN- J- Domain 

15 

[0042] Mittels des QuikChange-Mutagenese-Systems . (Promega, Mannheim, DE) wurden im Plasmid pUBS 
520-ptN-dnaJ nach dem Nucleotid 324 zwei Stop-Codone eingefugt. so daG nur noch die ersten 108 Aminosauren 
exprimiert werden. Die Sequenz des mutagenisierten Bereiches wurde durch Didesoxy-Sequenzierung (LiCor DNA- 
Sequencer 4000, MWG Biotech, Ebersberg) und die Expression des verkurzten Proteinfragments durch Western Blot- 
to ting und Detektion mit einem Anti-DnaJ-Antikorper nachgewiesen. Das entstandene Plasmid wurde mit pUBS 520-plN- 
J-Domain (Fig. 4) bezeichnet. 

Beispiel 4: 

2S Konstruktion des Expressionsplasmides pIN III ompA3-hsp25 

[0043] Das Gen, das fur Hsp25 codiert, Gene Bank Accession No.: L 07577, wurde Ober die Restriktionsschnittstellen 
EcoRI und BamHI in das Expressionsplasmid pIN III ompA3 (Ghayreb et ai, EMBO J. 3 (1984) 2437-2442) kloniert. 
Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
30 MWG Biotech, Ebersberg) uberpruft. Das resultierende Plasmid wurde pIN III ompA3-hsp25 bezeichnet. Die Sequenz 
des periplasmatisch exprimierten Hsp25 unterscheidet sich von dem Wildtyp- Protein dahingehend, daB die Polypep- 
tidsequenz mit Gly-lle-Leu beginnt statt mit Met, es land somit eine Verlangerung des N-Terminus um 2 Aminosduren 
statt. Hsp25 befindet sich damit unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-P-D-Thiogalactosid) 
induziert wird. 

35 

Beispiel 5: 

Konstruktion des Expressionsplasmides pUBS520-plN-hsp25 

40 [0044] Mittels PCR wurde der Bereich aus dem PlasmidpIN III ompA3-hsp25 amplifiziert, derfurdas lac-lpp Operon, 
die Signalsequenz, dashsp25-Gen und die Terminator-Region des Operons codiert (SEQ ID NO: 5). Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
risierten Vektor pUBS520 kloniert. Das resultierende Plasmid wurde pUBS520-plN-hsp25 bezeichnet (Fig. 5). 

45 Beispiel 6: 

Konstruktion des Expressionsplasmides pUBS520-ScFvOx 

[0045] Als negativ-Kontrolle wurde die Co-Expression eines Single-Chain-Fv-Fragmentes, das gegen das Hapten 
so Oxazolon gerichtet ist (ScFvOxazolon; Fiedler und Conrad, Bio/Technology 13(1 995) 1 090-1 093 untersucht, das keine 
Chaperon-Eigenschaften besitzt. 

[0046] Mittels PCR wurde der Bereich aus dem Plasmid pHEN-ScFvOx amplifiziert, der fur den lac-Promotor, die 
Signalsequenz pelB und das scfvox-Gen codiert. In einer zweiten PCR wurde der Bereich aus dem Plasmid pIN III 
ompA3 amplifiziert, d r fur den Ipp-Terminator codiert. In einer anschlieGenden PCR wurden die beiden Fragmente 
ss fusioniert. Das so entstandene PCR-Produkt (SEQ ID NO: 7) wurde mit der Restriktions ndonuclease Bglll geschnitten 
und in den mit der Restriktionsendonuclease BamHI linearisierten Vektor pUBS520 kloniert. Das resultierende Plasmid 
wurde pUBS520-ScFvOx bezeichnet (Fig. 6). 
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B ispiel 7: 

Konstruktion des Expressionsplasmides pET20b(+)-rPA 

5 [0047] Mil Hilfe der PCR-Methode wurde das Gen eines Plasminogenaktivators (rPA) aus dem Plasmidvektor 
pA27fd7 (Kohnert et al., Protein Engineering 5 (1992) 93-100) amplifiziert. Das PCR-Produkt wurde mit den Restrik- 
tionsendonucleasen Ncol und BamHI gespalten und in den Plasmidvektor pET20b(+) (Novagen Inc., Madison, USA) 
kloniert. Das Ptasmid codiert fur ein Fusionsprotein, welches aus der Signalsequenz von PelB (Pectatlyase aus Erwinia 
amylovora) und rPA besteht und die Sekretion von rPA ins Periplasma Didesoxy-Sequenzierung (LiCor DNA-Se- 

10 quencer 4000. MWG Biotech, Ebersberg, DE) uberpruft. Das Konstrukt wurde als pET20b(+)-rPA bezeichnet (Fig. 7). 
In dem Plasmid wird rPA unter Kontrolle des T7-Promotors exprimiert, wobei die T7-RNA-Polymerase im Stamm E. 
coli BL21(DE3) der Kontrolle des lacU V5-Promotors unterliegt. Die Induktion erlolgt durch Zugabe von IPTG. Das 
periplasmatisch exprimierte rPA unterscheidet sich von dem bei Kohnert et al beschriebenen Plasm inogenaktivator 
durch Austausch der zweiten Aminosaure (Ser) gegen Ala. 

is 

Beispiei 8: 

Funktionale Expression von rPA im Periplasma von E. coli r unter Verwendung der Medienzusatze Glutathion 
und L-Arginin 

20 

[0048] Eine strtttunaie Ubemachtkultur von E. coli BL21(DE3) (Studier & Moffat, J. Mol. Biol. 189 (1986) 113-130), 
die mit pET20o(t )-rPA und pUBS520-pl!M-dnaJ transformiert wurde (Co-Expression von DnaJ), eine Ubemachtkultur 
von E. coli BL2KDC3) die mit pET20b(+)-rPA und pUBS520-plN-J-Domain transformiert wurde (Co-Expression der 
J-Domane), enc Jbcrn.ichikultu- von E. coli BL21 (DE3), die mit pET20b(+)-rPAund pUBS520-plN-hsp25 transformiert 

25 wurde (Co-Exprcsson von Hop25), eine Ubemachtkultur von E. coli BL21(DE3), die mit pET20b(+)-rPA und 
pUBS520-ScFvOx irwnslormicrt wurde (Co-Expression von ScFvOx), eine Ubemachtkultur von E. coli BL21(DE3), die 
mit pET20b(+)-rPA und OUBS520 transformiert wurde bzw. eine Ubemachtkultur von E. coli BL21 (DE3), die mit pET20b 
(+) und pUBS520 irnnslormien wurde (Kontrollkultur). wurde im Verhaltnis 1:50 in 100 ml LB-Medium mit Ampicillin 
(100 u-g/ml) und KnnHmyrn (SO jig/ml, Fluka Chemica, Neu-Ulm, DE) verdunnt und bei 24°C und 170 rpm geschuttelt. 

30 Nach 3 h Wachstum wurdon >c 5ml der Kultur zu je 10 ml LB-Medium mit o.g. Mengen an Ampicillin und Kanamycin 
und verschiedenen Konzentraticnen von GSH (0-10 mM, Fluka, DE) und L-Arginin HCI (0-0,4 M. ICN) gegeben und 
mit jeweils 1mM IPTG (lsopropyl-|i-D-Thiogalactosid. AppliChem, Darmstadt, DE) induziert. Die Zellen wurden weitere 
21 h bei 24 °C und 170 rpm geschuttelt und nach Bestimmung der OD 600 eine 1 mi-Probe genommen. Diese 1ml- 
Zellproben wurden nacn emer modifizierten Vorschrift nach Jacobi et al. (J. Biol. Chem. 272 (1997) 21692-21699) in 

35 2 ml-Eppendorf-ReaktionsgefaRen fraktioniert. Im Detail wurde das Zellpellet mit 500 uJ Fraktionierungspuffer (150 
mM NaCI (Roth GmbH). 50 mM Tris/HCI (Roth GmbH, 5mM EDTA (Biomol) und 1 mg/ml Polymyxin-B-Sulfat (Sigma), 
pH 7.5) versetzt, 1 h beMO °C auf einem Eppendorl-Thermoschuttler bei 1400 rpm geschuttelt und dann 15 min bei 
1 4 000 rpm in einer auf 1 0°C gekuhlten Eppendorf-Mikrozentrif uge zentrif ugiert, so daB eine Fraktion mit den loslichen 
periplasmatischen Proteinen (Uberstand) und eine Restfraktion (Pellet) entstand. 

40 [0049] Die Bestimmung von der Aktivitat von rPA erfolgte im wesentlichen nach der Methode von Verheijen et al. 
Thromb. Haemostasis 48 (1982) 266-269). 

[0050] Alle ermtttelten rPA-Konzentrationen in den Zellextrakten wurden auf Zellsuspensionen von OD 600 =1 nor- 
miert, urn den Fehler der bei der Messung in verschiedenen Pattern auftritt, zu korrigieren. 

45 Beispiei 9: 

Funktionale Expression von rPA im Periplasma von E. coli unter Verwendung von Gemischen aus Glutathion 
mit Formamid, Methylformamid, Acetamid, Methylharnstoff sowie Ethylharnstoff als Medienzusatze 

so [0051] Eine stationare Ubemachtkultur von E. coli BL21 (DE3), die mit pET20b(+)-rPA und pUBS520-plN-dnaJ trans- 
formiert wurde (Co-Expression von DnaJ), wurde wie in Beispiei B angegeben kulttviert. Zusatzlich wurden Verbindun- 
gen der Formel I und jeweils 5 mM Glutathion dem Kulturmedium zugesetzt. Eine Kontrollkultur wurde in LB ohne 
Zusatze kultiviert. Die Verbindungen der Formel I und ihre eingesetzte Konzentration sind in Tabelle 3 aufgefuhrt. Die 
Probenaufbereitung, Periplasmaf raktionierung und der Enzymtest auf tPA-Aktivitat wurden wie in Beispiei 8 ausgefuhrt. 

ss [0052] Die Ergebnisse zur rPA Expression zeigen die Tabellen 1 und 2 sowie die Figuren 1 und 2. 
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[0053] Die Kultivierung erfolgte in Gegenwart von 5 mM GSH. 



Tabelle 2: 



Expression von nativem rPA im P riplasma von E. coli bei Co-S kr tion von DnaJ und Zusatz verschiedener 




niedermolekularer faltungsverbessernder Zusatze 




Zusatz 


Konzentration 


Menge rPA in 


Stimulations! aktor 




1 III ClLIUII 




im 


ng/ml*OD 600 




Zellernte 


GSH im Medium 




Kulturmedium 


im Periplasms 








ohne Zusatze 


- 


0,153 


24 


4,52 


0 mM 


Arginin 


0,2 M 


0,560 


21 


4,45 


5 mM 




0,4 M 


3,880 


17 


1,73 


5 mM 


Formamid 


0,6 M 


0,208 


17 


4,96 


5 mM 




1,0 M 


0,219 


10 


4,71 


5 mM 


Methylformamid 


0,3 M 


0,141 


15 


4,57 


5 mM 




0,6 M 


0,790 


17 


1,04 


5 mM 


Acetamid 


0,6 M 


0,150 


24 


5,34 


5 mM 




1,0 M 


1,321 


16 


1,57 


5 mM 


Methyl ham st off 


0,3 M 


0,168 


24 


4,67 


5 mM 




0,6 M 


0,830 


22 


4,59 


5 mM 


Ethylharnstoff 


0,3 M 


0,266 


23 


4,20 


5 mM 




0,6 M 


1,209 


17 


0,82 


5 mM 



Beispiei 10: 



Expression eines funktionellen Single-Chain-Fv-Fragmentes unter Zusatz von reduziertem Glutathion und L- 
Arginin zum Kulturmedium 



[0054] Eine stationare Ubernachtkultur von E. coli BL21 (DE3), die mit einem Plasmid, welches fur ein Single-chain- 
F v -Fragment eines anti-TSH Antikorpers codiert und pUBS520 transformiert wurde, wurde im Verhaltnis 1:50 in 100 
ml LB-Medium mit Ampicillin (100 u,g/ml) und Kanamycin (50 (ig/ml, Fluka Chemica, Neu-Ulm) verdunnl und bei 24°C 
und 170 rpm geschuttelt. Nach 3 h Wachstum wurden je 5ml der Kultur zu je 10 ml LB-Medium mit o.g. Mengen an 
Ampicillin und Kanamycin und verschiedenen Konzentrationen von GSH (0-10 mM, Fluka) und L-Arginin HCI (0-0,4 
M, ICN) gegeben uftd mit jeweils ImM IPTG (Isopropyl-p-D-Thiogalactosid, AppliChem, Darmstadt) induziert. Die Zel- 
len wurden weitere 21 h bei 24 °C und 1 70 rpm geschuttelt und nach Besttmmung der OD 600 eine 1 mi-Probe genom- 
men. Diese 1 ml-Zellproben wurden nach einer modifizierten Vorschrtft nach Jacobi et al. (J. Biol. Chem. 272 (1997) 
21692-21699) in 2 ml-Eppendorf-Reaktionsgefa3en fraktioniert (s. Beispiei 8). Weiterhin wurde eine Probe des Medi- 
enuberstandes (1 ml) genommen. Zur Analyse der Proben auf funktionellen Antikorpern wurden sie einem ELISA-Test 
unterzogen. 

[0055] Der Zusatz von L-Arginin und GSH zum Kulturmedium im Falle der Expression von ScFv-TSH hatte ebenfalls 
einen positiven EinfluB auf die Ausbeute an nativem ScFv-TSH im Periplasma und im Medium-Uberstand von E. coli. 
Bei Zugabe von 0,4 M L-Arginin und 5 mM GSH konnte die Menge an mittels ELISA detektiertem Antikorperfragment 
im Medien-Uberstand um das 39-fache (Fig. 8) und in der pertplasmatischen Fraktion urn das 10-fache (Fig. 9) ge- 
genuber einer Kultivierung ohne Medienzusatze gesteigert werden. 



so 
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SEQUENZ PROTOKOLL 



<110> F. Hoffmann- La Roche AG 

<120> Verfahren zur Herstellung von natuerlich 
gefalteuen und sekretierten Proteinen 

<130> Case 20379 

<160> 10 

<210> 1 

75 <211> 1881 

<212> DNA 

<213> E. COli 



10 



20 



40 



45 



SO 



<220> 

<221> CDS 



<222> (392) . . . (1591 ) 

<400> 1 

25 TAGGCGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 6 0 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 12 0 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

30 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 24 0 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 3 00 

35 GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 360 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 



55 



ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 46 0 

lie Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly lie 
TO 15 20 

CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 

Pro Ala Lys Gin Asp Tyr Tyr Glu He Leu Gly Val Ser Lys Thr Ala 
25 30 35 

GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC CTG GCC ATG AAA TAC 556 

Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
40 45 50 55 

CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 604 

His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
60 65 " 70 
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GAG ATC AAG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu lie Lys Glu Ala Tyr Glu val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 

5 

GCA TAC- GAT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 700 
Ala Tyr Asp Gin Tyr Gly His Ala .Ala Phe Glu Gin Gly Gly Met Gly 
90 95 100 

70 GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT GGT GAC 74 8 

Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp lie Phe Gly Asp 
1C5 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT CAA CGT GCG GCG 796 
75 Val Phe Gly Asp lie Phe Gly Gly Gly Arg Gly Arg Gin Arg Ala Ala 

120 125 130 135 

CGC GGT GCT GAT TTA CGC TAT AAC ATG GAG CTC ACC CTC GAA GAA GCT 84 4 

Arg Gly Ala Asp Leu Arg Tyr Asn Met Glu Leu Thr Leu Glu Glu Ala 
20 140 145 150 

GTA CGT GGC GTG ACC AAA GAG ATC CGC ATT CCG ACT CTG GAA GAG TGT 8 92 

Val Arg Gly Val Thr Lys Glu lie Arg lie Pro Thr Leu Glu Glu Cys 
155 160 165 

25 

GAC GTT TGC CAC GGT AGC GGT GCA AAA CCA GGT ACA CAG CCG CAG ACT 94 0 

Asp Val Cys His Gly Ser Gly Ala Lys Pro Gly Thr Gin Pro Gin Thr 
170 175 180 

30 TGT CCG ACC TGT CAT GGT TCT GGT CAG GTG CAG ATG CGC CAG GGA TTC 98 8 

Cys Pro Thr Cys His Gly Ser Gly Gin Val Gin Met Arg Gin Gly Phe 
185 190 195 

TTC GCT GTA CAG CAG ACC TGT CCA CAC TGT CAG GGC CGC GGT ACG CTG 103 6 

3S Phe Ala val Gin Gin Thr cys Pro His Cys Gin Gly Arg Gly Thr Leu 

200 205 210 215 

ATC AAA GAT CCG TGC AAC AAA TGT CAT GGT CAT GGT CGT GTT GAG CGC 1084 
lie Lys Asp Pro Cys Asn Lys Cys His Gly His Gly Arg Val Glu Arg 
220 225 230 



40 



SO 



55 



AGC AAA ACG CTG TCC GTT AAA ATC CCG GCA GGG GTG GAC ACT GGA GAC 1132 

Ser Lys Thr Leu Ser Val Lys lie Pro Ala Gly Val Asp Thr Gly Asp 

235 240 245 

CGC ATC CGT CTT GCG GGC GAA GGT GAA GCG GGC GAG CAT GGC GCA CCG 1180 

Arg He Arg Leu Ala Gly Glu Gly Glu Ala Gly Glu His Gly Ala Pro 
250 255 260 

GCA GGC GAT CTG TAC GTT CAG GTT CAG GTT AAA CAG CAC CCG ATT TTC 122 8 

Ala Gly Asp Leu Tyr Val Gin Val Gin Val Lys Gin His Pro lie Phe 
265 270 275 

GAG CGT GAA GGC AAC AAC CTG TAT TGC GAA GTC CCG ATC AAC TTC GCT 127 6 

Glu Arg Glu Gly Asn Asn Leu Tyr Cys Glu Val Pro He Asn Phe Ala 
280 285 290 295 
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35 



ATG GCG GCG CTG GGT GGC GAA ATC GAA GTA CCG ACC CTT GAT GGT CGC 13 24 

Met Ala Ala Leu Gly Gly Glu He Glu Val Pro Thr Leu Asp Gly Arg 
300 305 310 

GTC AAA CTG AAA GTG CCT GGC GAA ACC CAG ACC GGT AAG CTA TTC CGT 1372 
Val Lys Leu Lys Val Pro Gly Glu Thr Gin Thr Gly Lys Leu Phe Arg 
315 320 325 

ATG CGC GGT AAA GGC GTC AAG TCT GTC CGC GGT GGC GCA CAG GGT GAT 1420 
Met Arg Gly Lys Gly Val Lys Ser Val Arg Gly Gly Ala Gin Gly Asp 
330 335 340 

TTG CTG TGC CGC GTT GTC GTC GAA ACA CCG GTA GGC CTG AAC GAA AGG 14 68 

Leu Leu Cys Arg val val Val Glu Thr Pro Val Gly Leu Asn Glu Arg 
345 350 355 

CAG AAA CAG CTG CTG CAA GAG CTG CAA GAA AGC TTC GGT GGC CCA ACC 1516 
Gin Lys Gin Leu Leu Gin Glu Leu Gin Glu Ser Phe Gly Gly Pro Thr 
360 365 370 375 

GGC GAG CAC AAC AGC CCG CGC TCA AAG AGC TTC TTT GAT GGT GTG AAG 1564 
Gly Glu His Asn Ser Pro Arg Ser Lys Ser Phe Phe Asp Gly Val Lys 
380 385 390 

AAG TTT TTT GAC GAC CTG ACC CGC TAA GGATCCGGCT GAGCAACGAC 1611 
^ Lys Phe Phe Asp Asp Leu Thr Arg * 

395 400 

GTGAACGCAA TGCGTTCCGA CGTTCAGGCT GCTAAAGATG ACGCAGCTCG TGCTAACCAG 1671 

CGTCTGGACA ACATGGCTAC TAAATACCGC AAGTAATAGT ACCTGTGAAG TGAAAAATGG 1731 

CGCACATTGT GCGACATTTT TTTTGTCTGC CG TTT AC CGC TACTGCGTCA CGCGTAACAT 17 91 

ATTCCCTTGC TCTGGTTCAC CATTCTGCGC TGACTCTACT GAAGGCGCAT TGCTGGCTGC 1851 

GGGAGTTGCT CCACTGCTCA CCGAAACCGG 18 81 



40 



45 



50 



55 



<210> 2 

<211> 400 

<212> PRT 

<213> E. COli 

<400> 2 

Met Lys Lys Thr Ala He Ala He Ala Val Ala Leu Ala Gly Phe Ala 
15 10 15 

Thr Val Ala Gin Ala Gly He Pro Ala Lys Gin Asp Tyr Tyr Glu He 
20 25 30 

Leu Gly Val Ser Lys Thr Ala Glu Glu Arg Glu He Arg Lys Ala Tyr 
35 40 45 
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10 



15 



Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu He Lys Glu Ala Tyr Glu Val Leu 
.65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
85 90 95 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
1O0 105 110 

Phe Ser Asp He Phe Gly Asp Val Phe Gly Asp He Phe Gly Gly Gly 
115 120 125 

Arg Gly Arg Gin Arg Ala Ala Arg Gly Ala Asp Leu Arg Tyr Asn Met 
130 135 140 

Glu Leu Thr Leu Glu Glu Ala Val Arg Gly Val Thr Lys Glu He Arg 
20 145 150 155 160 

He Pro Thr Leu Glu Glu Cys Asp Val Cys His Gly Ser Gly Ala Lys 
165 170 175 

2S Pro Gly Thr Gin Pro Gin Thr Cys Pro Thr Cys His Gly Ser Gly Gin 

180 185 190 

Val Gin Met Arg Gin Gly Phe Phe Ala Val Gin Gin Thr Cys Pro His 
195 200 205 

30 

Cys Gin Gly Arg Gly Thr Leu He Lys Asp Pro Cys Asn Lys Cys His 
210 215 220 

Gly His Gly Arg Val Glu Arg Ser Lys Thr Leu Ser Val Lys He Pro 
225 230 235 240 

Ala Gly Val Asp Thr Gly Asp Arg He Arg Leu Ala Gly Glu Gly Glu 
245 250 255 

Ala Gly Glu His Gly Ala Pro Ala Gly Asp Leu Tyr Val Gin Val Gin 
260 265 270 

Val Lys Gin His Pro He Phe Glu Arg Glu Gly Asn Asn Leu Tyr Cys 
275 280 285 

Glu Val Pro He Asn Phe Ala Met Ala Ala Leu Gly Gly Glu He Glu 
290 295 300 

Val Pro Thr Leu Asp Gly Arg Val Lys Leu Lys Val Pro Gly Glu Thr 
305 310 315 320 

Gin Thr Gly Lys Leu Phe Arg Met Arg Gly Lys Gly Val Lys Ser Val 
325 330 335 

Arg Gly Gly Ala Gin Gly Asp Leu Leu Cys Arg Val Val Val Glu Thr 
55 340 345 350 



35 



40 



45 



SO 
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10 



15 



25 



40 



SO 



Pro Val Gly Leu Asn Glu Arg Gin Lys Gin Leu Leu Gin Glu Leu Gin 

355 360 365 

Glu Ser Phe Gly Gly Pro Thr Gly Glu His Asn Ser Pro Arg Ser Lys 
370 375 380 

Ser Phe Phe Asp Gly Val Lys Lys Phe Phe Asp Asp Leu Thr Arg * 

385 390 395 " 400 



<210> 3 

<211> 1381 

<212> DN T A 

<213> £ . coli 

<220> 

<221> CDS 

20 <222> (392) . . . (790) 

<400> 3 



TAGGCGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

30 TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 24 0 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 3 00 

GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CT ATG AC CAT GATTACGGAT 3 60 

35 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 4 60 
He Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly He 
10 15 20 

CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 
Pro Ala Lys Gin Asp Tyr Tyr Glu He Leu Gly Val Ser Lys Thr Ala 
45 25 30 35 

GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC QTG GCC ATG AAA TAC 556 
Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
40 45 50 55 



CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 604 
His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
60 65 70 



55 
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GAG ATC .ARG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu He Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 



35 



40 



45 



GCA TAC GkT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 
Ala Tyr Asp Gin Tyr Gly His Ala Ala Phe Glu Gin Gly Gly Met Gly 
90 95 100 



700 



GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT GGT GAC 74 8 
Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp He Phe Gly Asp 
105 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT TAA TAG 7 90 
Val Phe Gly Asp He Phe Gly Gly Gly Arg Gly Arg * * 
120 125 130 

GCGGCGCGCG GTGCTGATTT ACG CTATAAC ATGGAGCTCA CCCTCGAAGA AGCTGTACGT 850 

GGCGTGACCA AAGAGATCCG CATTCCGACT CTGGAAGAGT GTGACGTTTG CCACGGTAGC 910 

GGTGCAAAAC CAGGTACACA GCCGCAGACT TGTCCGACCT GTCATGGTTC TGGTCAGGTG 970 

CAG ATG CG CC AGGGATTCTT CG CTGT AC AG CAG AC CTGTC CACACTGTCA GGGCCGCGGT 1030 

ACGCTGATCA AAGATCCGTG CAACAAATGT CATGGTCATG GTCGTGTTGA G CG CAGCAAA 10 90 

ACGCTGTCCG TTAAAATCCC GGCAGGGGTG GACACTGGAG ACCGCATCCG TCTTGCGGGC 1150 

GAAGGTGAAG CGGGCGAGCA TGGCGCACCG GCAGGCGATC TGTACGTTCA GGTTCAGGTT 1210 

AAACAGCACC CGATTTTCGA GCGTGAAGGC AACAACCTGT ATTGCGAAGT CCCGATCAAC 12 7 0 

TTCGCTATGG CGGCGCTGGG TGGCGAAATC GAAGTACCGA CCCTTGATGG TCGCGTCAAA 13 30 

CTG AAAGTGC CTGGCGAAAC CCAGACCGGT AAGCTATTCC GTATGCGCGG TAAAGGCGTC 13 90 

AAGT CTGTCC GCGGTGGCGC ACAGGG TG AT TTGCTGTGCC G CG TTGTCGT CG AAA C AC CG 14 50 

GTAGGCCTGA ACGAAAGGCA GAAACAGCTG CTGCAAGAGC TGCAAGAAAG CTTCGGTGGC 1510 

CCAACCGGCG AGCACAACAG CCCGCGCTCA AAGAGCTTCT TTGATGGTGT GAAGAAGTTT 157 0 

TTTGACGACC TGACCCGCTA AGGATCCGGC TGAGCAACGA CGTGAACGCA ATGCGTTCCG 163 0 

ACGTTCAGGC TGCTAAAGAT GACGCAGCTC GTGCTAACCA GCGTCTGGAC AACATGGCTA 1690 

CTAAATACCG CAAGTAATAG TACCTGTGAA GTGAAAAATG GCGCACATTG TGCGACATTT 17 50 

TTTTTGTCTG CCGTTTACCG CTACTGCGTC ACGCGTAACA TATTCCCTTG CTCTGGTTCA 1310 

SO CCATTCTG CG CTG ACT CT AC TGAAGGCGCA TTGCTGGCTG CGGGAGTTGC TCCACTGCTC 187 0 

ACCGAAACCG G 1881 



55 
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15 



<210> 4 

<211> 133 

<212> PRT 

<213> E. coli 

<400> 4 

Met Lys Lys Thr Ala lie Ala He Ala Val Ala Leu Ala Gly Phe Ala 
15 10 15 

Thr Val Ala Gin Ala Gly He Pro Ala Lys Gin Asp Tyr Tyr Giu He 
. 20 25 30 

Leu Gly Val Ser Lys Thr Ala Glu Glu Arg Glu He Arg Lys Ala Tyr 
35 40 45 

Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu He Lys Glu Ala Tyr Glu Val Leu 
65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
85 90 95 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
100 105 110 

Phe Ser Asp He Phe Gly Asp Val Phe Gly Asp He Phe Gly Gly Gly 
30 115 120 125 

Arg Gly Arg * * 
130 



20 



25 



35 

<210> 
<211> 
<212> 
<213> 

40 

<220> 
<221> 
<222> 

45 <400> 

TAGGCGTATC 
CTATATAATC 

50 

TTTTTATCTA 
TCCCATCAAA 
GAGATTAACT 



5 

1379 
DNA 

E. coli 
CDS 

(392) . . . (1090) 
5 

ACGAGGCCCT TTGGATAACC 
TCACTTTATC TAAGATGAAT 
AAACCCAGCG TTCGATGCTT 
AAAATATTCT CAACATAAAA 
CAATCTAGCT AGAGAGGCTT 



AGAAGCAATA AAAAATCAAA 

CCCATGGA^G CATCCTGTTT 

CTTTGAGCGA ACGATCAAAA 

AACTTTGTGT AATACTTGTA 

T AC AC TTT AT GCTTCCGGCT 



TCGGATTTCA 60 

TCTCTCAATT 12 0 

ATAAGTGCCT 180 

ACGCTACATG 2 40 

CGTATAATGT 3 00 
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w 



15 



20 



35 



40 



GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 3 60 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 4 60 

He Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly He 
10 15 20 

CTC ACC GAG CGC CGC GTG CCC TTC TCG CTG CTG CGG AGC CCG AGC TGG 508 
Leu Thr Glu Arg Arg Val Pro Phe Ser Leu Leu Arg Ser Pro Ser Trp 
25 30 35 

GAA CCA TTC CGG GAC TGG TAC CCT GCA CAC AGC CGC CTC TTC GAT CAA 556 
Glu Pro Phe Arg Asp Trp Tyr Pro A3 a His Ser Arg Leu Phe Asp Gin 
40 45 50 55 



GCT TTC GGG GTG CCC CGG TTG CCC GAT GAG TGG TCG CAG TGG TTC AGC 
Ala Phe Gly Val Pro Arg Leu Pro Asp Glu Trp Ser Gin Trp Phe Ser 
€0 65 70 



GAG GGC CCC GCG GCG GTG ACC CTG GCC GCA CCA GCC TTC AGC CGA GCG 
Glu Gly Pro Ala Ala Val Thr Leu Ala Ala Pro Ala Phe Ser Arg Ala 
30 90 95 100 



604 



GCC GCT GGG TGG CCC GGA TAC GTG CGC CCG CTG CCC GCC GCG ACC GCC 652 
25 Ala Ala Gly Trp Pro Gly Tyr Val Arg Pro Leu Pro Ala Ala Thr Ala 

75 80 85 



700 



CTC AAC CGA CAG CTC AGC AGC GGG GTC TCG GAG ATC CGA CAG ACG GCT 74 8 

Leu Asn Arg Gin Leu Ser Ser Gly Val Ser Glu He Arg Gin Thr Ala 
105 HO us 

GAT CGC TGG CGC GTG TCC CTG GAC GTC AAC CAC TTC GCT CCG GAG GAG 7 96 

Asp Arg Trp Arg Val Ser Leu Asp Val Asn His Phe Ala Pro Glu Glu 
120 125 130 135 

CTC ACA GTG AAG ACC AAG GAA GGC GTG GTG GAG ATC ACT GGC AAG CAC 84 4 

Leu Thr Val Lys Thr Lys Glu Gly Val Val Glu He Thr Gly Lys His 

140 145 150 



GAA GAA AGG CAG GAC GAA CAT GGC TAC ATC TCT CGG TGC TTC ACC CGG 8 92 

Glu Glu Arg Gin Asp Glu His Gly Tyr He Ser Arg Cys Phe Thr Arg 
45 155 160 165 

AAA TAC ACG CTC CCT CCA GGT GTG GAC CCC ACC CTA GTG TCC TCT TCC 940 
Lys Tyr Thr Leu Pro Pro Gly Val Asp Pro Thr Leu Val Ser Ser Ser 
170 175 180 

SO 

CTA TCC CCT GAG GGC ACA CTT ACC GTG GAG GCT CCG TTG CCC AAA CCA 988 
Leu Ser Pro Glu Gly Thr Leu Thr Val Glu Ala Pro Leu Pro Lys Ala 
1B5 190 195 

55 
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10 



1S 



20 



40 
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GTC ACG CAG TCA GCG GAG ATC ACC ATT CCG GTT ACT TTC GAG GCC CGC 1036 

Val Thr Gin Ser Ala Glu lie Thr lie Pro Val Thr Phe Glu Ala Arg 
200 205 210 215 

GCC CAA ATT GGG GGC CCA GAA GCT GGG AAG TCT GAA CAG TCT GGA GCC 1084 

Ala Gin lie Gly Gly Pro Glu Ala Gly Lys Ser Glu Gin Ser Gly Ala 
220 225 230 

AAG TAG GATCCGGCTG AGCAACGACG TGAACGCAAT GCGTTCCGAC GTTCAGGCTG 114 0 

Lys 



CTAAACATGA CGC AG CTCGT GCTAACCAGC GTCTGGACAA CATGGCTACT AAAT AC CGC A 12 00 

AGTAATAGTA CCTGTGAAGT GAAAAATGGC GCACATTGTG CGACATTTTT TTTGTCTGCC 12 60 

GTTTACCGCT ACTGCGTCAC GCGTAACATA TTCCCTTGCT CTGGTTCACC ATTCTGCGCT 132 0 

GACTCTAC7G AAGGCGCATT GCTGGCTGCG GGAGTTGCTC CACTGCTCAC CGAAACCGG 13 7 9 



<210> 6 

<211> 233 

25 < 2 1 2 > PHT 

<213> E ro)i 

<400> 6 

30 Met Lys Lys Thr Ala lie Ala lie Ala Val Ala Leu Ala Gly Phe Ala 

15 10 15 

Thr Val Ala Cln Ala Gly lie Leu Thr Glu Arg Arg Val Pro Phe Ser 
20 25 30 

35 

Leu Leu Arg Ser Pro Ser Trp Glu Pro Phe Arg Asp Trp Tyr Pro Ala 
35 40 45 

His Ser Arg Leu Phe Asp Gin Ala Phe Gly Val Pro Arg Leu Pro Asp 
50 55 60 

Glu Trp Ser Gin Trp Phe Ser Ala Ala Gly Trp Pro Gly Tyr Val Arg 
65 70 75 60 

Pro Leu Pro Ala Ala Thr Ala Glu Gly Pro Ala Ala Val Thr Leu Ala 
45 B5 90 95 

Ala Pro Ala Phe Ser Arg Ala Leu Asn Arg Gin Leu Ser Ser Gly Val 
100 105 110 

SO Ser Glu lie Arg Gin Thr Ala Asp Arg Trp Arg Val Ser Leu Asp Val 

115 120 125 

Asn His Phe Ala Pro Glu Glu Leu Thr Val Lys Thr Lys Glu Gly Val 
130 135 140 
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Val Glu He Thr 
145 

5 He Ser Arg Cys 



Pro Thr Leu Val 
180 

w 

Glu Ala Pro Leu 
195 

Pro Val Thr Phe 



Lys Ser Glu Gin 
225 



Gly Lys His Glu 
150 

Phe Thr Arg Lys 
165 

Ser Ser Ser Leu 



Pro Lys Ala Val 
200 

Glu Ala Arg Ala 
215 

Ser Gly Ala Lys 
230 



Glu Arg Gin Asp 
155 

Tyr Thr Leu Pro 
170 

Ser Pro Glu Gly 
185 

Thr Gin Ser Ala 



Gin He Gly Gly 
220 



Glu His Gly Tyr 
160 

Pro Gly Val Asp 
17S 

Thr Leu Thr Val 
190 

Glu He Thr He 
205 

Pro Glu Ala Gly 



20 <210> 7 

<211> 1256 

<212> DNA 

<213> E. coli 

25 <r220> 

<22l> CDS 

<222> (199) . . . {969) 



30 



35 



40 



45 



<400> 7 

GATCTGGCTT TACACTTTAT GCTTCCGGCT CGTATGTTGT GTGGAATTGT GAGCGGATAA 60 
CAATTT C AC A CAGGAAACAG CTATGACCAT GATTACG CCA AGCTTGCATG CAAATTCTAT 



ATC TAC TAT GCA GAC ACA GTG AAG GGC CGA TTC ACC ATC TCC AG A GAC 
He Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr He Ser Arg Asp 
60 65 70 75 



120 



TTCAAGGAGA CAGTCATAAT G AAAT AC CT A TTGCCTACGG CAGCCGCTGG ATTGTTATTA 180 

CTCGCGGCCC AGCCGGCC ATG GCC GAG GTC AAG CTG CAG GAG TCT GGG GGA 2 31 

Met Ala Glu Val Lys Leu Gin Glu Ser Gly Gly 

1 5 10 

GGC TTA GTG CAG CCT GGA GGG TCC CGG AAA CTC TCC TGT GCA GCC TCT 2 79 

Gly Leu Val Gin Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser 
15 20 25 

GGA TTC ACT TTC AGT AGC TTT GGA ATG CAC TGG GTT CGT CAG GCT CCA 3 27 

Gly Phe Thr Phe Ser Ser Phe Gly Met His Trp Val Arg Gin Ala Pro 
30 35 40 

GAG AAG GGG CTG GAG TGG GTC GCA TAT ATT AGT AGT GGC AGT AGT ACC 3 75 

Glu Lys Gly Leu Glu Trp Val Ala Tyr He Ser Ser Gly Ser Ser Thr 

SO 45 50 55 



423 
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AAT CCC AAG AAC ACC CTG TTC CTG CAA ATG ACC AGT CTA AGG TCT GAG 4 71 

Asn Pro Lys Asn Thr Leu Phe Leu Gin Met Thr Ser Leu Arg Ser Glu 
80 85 90 

GAC ACG GCC ATG TAT TAC TGC GCA AGA GAT TAC GGG GCT TAT TGG GGC 519 

Asp Thr Ala Met Tyr Tyr Cys Ala Arg Asp Tyr Gly Ala Tyr Trp Gly 
95 100 105 

CAA GGG ACC ACG GTC ACC GTC TCC TCA GGT GGA GGC GGT TCA GGC GGA 567 

Gin Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly 
110 115 120 

GGT GGC TCT GGC GGT GGC GGA TCG GAC ATT GAG CTC ACC CAG TCT CCA 615 

Gly Gly Ser Gly Gly Gly Gly Ser Asp lie Glu Leu Thr. Gin Ser Pro 

125 130 135 

GCA ATC ATG TCT GCA TCT CCA GGG GAG AAG GTC ACC ATG ACC TGC AGT 6 63 

Ala He Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser 
140 145 150 155 

GCC AGT TCA AGT GTA AGG TAC ATG AAC TGG TTC CAA CAG AAG TCA GGC 711 

Ala Ser Ser Ser Val Arg Tyr Met Asn Trp Phe Gin Gin Lys Ser Gly 
160 165 170 

25 ACC TCC CCC AAA AGA TGG ATT TAT GAC ACA TCC AAA CTG TCT TCT GGA 759 

Thr Ser Pro Lys Arg Trp He Tyr Asp Thr Ser Lys Leu Ser Ser Gly 
175 180 185 



10 



15 



20 



30 



35 



40 



GTC CCT GCT CGC TTC AGT GGC AGT GGG TCT GGG ACC TCT TAC TCT CTC 807 
Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu 
190 195 200 

ACA ATC AGC AGC ATG GAG GCT GAA GAT GCT GCC ACT TAT TAC TGC CAG 855 
Thr He Ser Ser Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin 
205 210 215 

CAG TGG AGT AGT AAT CCA CTC ACT TTC GGT GCT GGG ACC AAG CTG GAG 903 
Gin Trp Ser Ser Asn Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu 
220 225 230 235 

CTG AAA CGG GCG GCC GCA GAA CAA AAA CTC ATC TCA GAA GAG GAT CTG 951 
Leu Lys Arg Ala Ala Ala Glu Gin Lys Leu He Ser Glu Glu Asp Leu 
240 245 250 

AAT GGG GCC GCA TAG TAA CTG AGC AA CG ACGTGAACGC AATGCGTT CC 999 
45 Asn Gly Ala Ala * 

255 

GACGTTCAGG CTGCTAAAGA TGACGCAGCT CG TG CT AAC C AG CGTCTGG A CAACATGGCT 10 5 9 
50 ACTAAATACC GCAAGTAATA GTACCTGTGA AG TG AAAAAT GGCGCACATT GTGCGACATT 1119 

TTTTTTGTCT GCCGTTTACC GCTACTGCGT CACGCGTAAC AT ATTC CCTT GCTCTGGTTC 117 9 
ACCATTCTGC GCTGACTCTA CTGAAGGCGC ATTGCTGGCT GCGGGAGTTG CTCCACTGCT 12 3 9 

55 
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CACCGAAACC GGAGATC 12 56 



10 



15 



20 



40 



c210> 8 

<2l\> 257 

<212> PRT 

<213> E. coli 

<400> 8 



Met Ala Glu Val Lys Leu Gin Glu Ser Gly Gly Gly Leu Val Gin Pro- 
1 5 10 15 

Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser 
20 25 30 

Ser Phe Gly Met His Trp Val Arg Gin Ala Pro Glu Lys Gly Leu Glu 
35 40 45 

Trp Val Ala Tyr lie Ser Ser Gly Ser Ser Thr lie Tyr Tyr Ala Asp 
50 " 55 60 

Thr Vai Lys Gly Arg Phe Thr He Ser Arg Asp Asn Pro Lys Asn Thr 
25 70 75 80 

Leu Phe Leu Gin Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr 
85 90 95 

30 7 V r °y s Ala ^9 Gly Ala Tyr Trp Gly Gin Gly Thr Thr Val 

100 105 110 

Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 
115 120 125 

35 

Gly Gly Ser Asp He Glu Leu Thr Gin Ser Pro Ala He Met Ser Ala 
^3C 135 140 

Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val 
145 150 155 160 

Arg Tyr Met Asn Trp Phe Gin Gin Lys Ser Gly Thr Ser Pro Lys Arg 
165 170 175 

Trp He Tyr Asp Thr Ser Lys Leu Ser Ser Gly Val Pro Ala Arg Phe 
45 180 185 190 

Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr He Ser Ser Met 
195 200 205 

SO Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin Gin Trp Ser Ser Asn 

210 215 220 

Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Ala 
225 230 235 240 

55 
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Ala Glu Gin Lys Leu lie Ser Glu Glu Asp Leu Asn Gly Ala Ala * 
245 250 255 



70 



75 



20 



35 



40 



45 



<210> 9 

<211> 1137 

<212> DNA 

< 2 1 3 > E. coli 

<220> 

<221> CDS 

<222> (1) . . . (1137) 

<400> 9 

ATG AAA TAC CTG CTG CCG ACC GCT GCT GCT GGT CTG CTG CTC CTC GCT 4 8 

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 
15 10 15 



GCC CAG CCG GCG ATG GCC ATG GCT TAC CAA GGA AAC AGT GAC TGC TAC 96 
Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 
2$ 20 25 30 

TTT GGG AAT GGG TCA GCC TAC CGT GGC ACG CAC AGC CTC ACC GAG TCG 144 

Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 

30 

GGT GCC TCC TGC CTC CCG TGG AAT TCC ATG ATC CTG ATA GGC AAG GTT 192 

Gly Ala Ser Cys . Leu Pro Trp Asn Ser Met lie Leu lie Gly Lys Val 
50 55 60 

TAC AC A GCA CAG AAC CCC AGT GCC CAG GCA CTG GGC CTG GGC AAA CAT 24 0 

Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

AAT TAC TGC CGG AAT CCT GAT GGG GAT GCC AAG CCC TGG TGC CAC GTG 2 88 

Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

CTG ACG AAC CGC AGG CTG ACG TGG GAG TAC TGT GAT GTG CCC TCC TGC 336 
Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 110 

TCC ACC TGC GGC CTG AGA CAG TAC AGC CAG CCT CAG TTT CGC ATC AAA 3 84 

Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg lie *Lys 
115 120 125 

SO GGA GGG CTC TTC GCC GAC ATC GCC TCC CAC CCC TGG CAG GCT GCC ATC 4 32 

Gly Gly Leu Phe Ala Asp lie Ala Ser His Pro Trp Gin Ala Ala lie 
130 135 140 
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40 
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TTT GCC AAG CAC AGG AGG TCG CCC GGA GAG CGG TTC CTG TGC GGG GGC 4 80 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 
145 150 155 160 

ATA CTC ATC AGC TCC TGC TGG ATT CTC TCT GCC GCC CAC TGC TTC CAG 52 8 

lie Leu lie Ser Ser Cys Trp He Leu Ser Ala Ala His Cys Phe Gin 
165 170 175 

CAG ACC TTT CCC CCC CAC CAC CTG ACG GTG ATC TTG GGC AGA ACA TAC 576 
Glu Arg Phe Pro Pro His His Leu Thr Val He Leu Gly Arg Thr Tyr 
180 185 190 

CGG GTG GTC CCT GGC GAG GAG GAG CAG AAA TTT GAA GTC GAA AAA TAC 624 
Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 
195 200 205 

ATT GTC CAT AAG GAA TTC GAT GAT GAC ACT TAC GAC AAT GAC ATT GCG 672 
He Val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp He Ala 
210 215 220 

CTG CTG CAG CTG AAA TCG GAT TCG TCC CGC TGT GCC CAG GAG AGC AGC 720 
Leu Leu Gin Leu Lys Ser Asp Ser Ser Arg Cys Ala Gin Glu Ser Ser 
225 230 235 240 



25 GTG GTC CGC ACT GTG TGC CTT CCC CCG GCG GAC CTG CAG CTG CCG GAC 

Val Val Arg Thr Val Cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 
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TGG ACG GAG TGT GAG CTC TCC GGC TAC GGC AAG CAT GAG GCC TTG TCT 816 

30 Tr P Thr Glu °V S Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 

260 265 270 

CCT TTC TAT TCG GAG CGG CTG AAG GAG GCT CAT GTC AGA CTG TAC CCA 8 64 

Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
3S 275 280 285 ' 

TCC AGC CGC TGC ACA TCA CAA CAT TTA CTT AAC AGA ACA GTC ACC GAC 912 

Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val Thr Asp 
290 295 300 

AAC ATG CTG TGT GCT GGA GAC ACT CGG AGC GGC GGG CCC CAG GCA AAC 960 

Asn Met Leu O/s Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 

305 310 315 320 

TTG CAC GAC GCC TGC CAG GGC GAT TCG GGA GGC CCC CTG GTG TGT CTG 1008 

Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 

AAC GAT GGC CGC ATG ACT TTG GTG GGC ATC ATC AGC TGG GGC CTG GGC 1056 

Asn Asp Gly Arg Met Thr Leu Val Gly He He Ser Trp Gly Leu Gly 
50 340 345 350 

TGT GGA CAG AAG GAT GTC CCG GGT GTG TAC ACC AAG GTT ACC AAC TAC 1104 

Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 365 
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CTA GAC TGG ATT CGT GAC AAC ATG CGA CCG TGA 1137 
Leu Asp Trp He Arg Asp Asn Met Arg Pro * 
370 375 
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<210> 10 
<211> 379 

<212> . PRT 
<213> E. coli 

<400> 10 

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 
1 5 10 15 

Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 
20 25 3D 

Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 

Gly Ala Ser Cys Leu Pro Trp Asn Ser Met He Leu He Gly Lys Val 
50 55 60 

Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 110 

Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg He Lys 
115 120 125 

Gly Gly Leu Phe Ala Asp He Ala Ser His Pro Trp Gin Ala Ala He 
130 135 140 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 
145 150 155 160 

He Leu He Ser Ser Cys Trp He Leu Ser Ala Ala His Cys Phe Gin 
165 170 175 

Glu Arg Phe Pro Pro His His Leu Thr Val He Leu Gly Arg Thr Tyr 
180 185 190 

Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 
195 200 205 

He val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp He Ala 
210 215 220 
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30 



Leu Leu Gin Leu Lys Ser Asp Ser Ser Arg Cys Ala Gin Glu Ser Ser 
225 230 235 240 

Val Val Arg Thr Val Cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 

Trp Thr Glu Cys Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 
260 265 270 

Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
275 280 2e5 

Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val Thr Asp 
290 295 300 

Asn Met Leu Cys Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 
^05 310 315 320 

Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 

Asn Asp Gly Arg Met Thr Leu Val Gly lie lie Ser Trp Gly Leu Gly 
340 345 350 

Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 ' 365 

Leu Asp Trp lie Arg Asp Asn Met Arg Pro * 
370 375 
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Pat ntanspruche 

1. Verfahren zur Herstellung eines wasserloslichen. naturlich gefalteten eukaryontischen Polypeptids, enthaltend 
zwei oder mehrere uber Disulfidbrucken verknupfte Cysteine, 
durch Kultivierung prokaryontischer Zellen, 

a) wobei die genannten prokaryontischen Zellen einen Expressionsveklor enthalten, der fur das genannte 
Polypeptid, das am N-Terminus eine prokaryontische Signalsequenz enthalt, codiert, 

b) unter Bedingungen : bei denen das Polypeptid in das Periplasma Oder das Medium sekretiert wird, 

c) Abspaltung der Signalsequenz und Isolierung des Polypeptids aus dem Periplasma Oder dem Medium, 

dadurch gekennzeichnet ; daB die Kultivierung in Gegenwart von Arginin oder einer Verbindung der allgemeinen 
Formel I 



R 2 -CO-NRR 1 

erfolgt, wobei R und R-, Wasserstoff Oder eine gesattigte Oder ungesattigte verzweigte oder unverzweigte C^C 4 - 
Alkylkette und 

R 2 Wasserstoff, NHR 1 oder eine gesattigte oder ungesattigte verzweigte oder unverzweigte C 1 -C 3 -Alkylkette dar- 
stellen. 

2. Veriahren nach Anspruch 1 , dadurch gekennzeichnet, daB Arginin als Hydrochlorid oder als andere titrierte Form 
verwendet wird. 

3. Veriahren nach den Anspruchen 1 bis 2, dadurch gekennzeichnet daB dem Nahrmedium ein reduzierendes Thiol- 
reagenz zugesetzt wird. 

4. Veriahren nach Anspruch 3 : dadurch gekennzeichnet : daB als reduzierendes Thiolreagenz Glutathion (GSH) ver- 
wendet wird. 

5. Veriahren nach den Anspruchen 1 bis 4, dadurch gekennzeichnet, daB die Signalsequenz aus gramnegativen 
Bakterien stammt. 

6. Veriahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daB die prokaryontische Zelle einen wei- 
teren Expressionsvektor, der fur ein molekulares Chaperon codiert, enthalt. 

7. Veriahren nach Anspruch 6, dadurch gekennzeichnet, daB das molekulare Chaperon DNAJaus E. coli oder HSP25 
ist. 

8. Verfahren nach einem der Anspruche 6 oder 7, dadurch gekennzeichnet, daB die fur das molekulare Chaperon 
codierende rekombinante DNA in operativer Verknupfung mit einem DNA-Fragment steht, das ein Signalpeptid 
zum Durchdringen der inneren bakteriellen Membran codiert. 

9. Veriahren nach einem der Anspruche 6 bis 8, dadurch gekennzeichnet daB sich die fur das sekretierte molekulare 
Chaperon und/oder fur das sekretierte Protein codierende DNA unter Kontrolle eines induzierbaren Expressions- 
signals befindet. 

10. Verfahren nach einem der Anspruche 1 bis 9, dadurch gekennzeichnet, daB das Polypeptid ein Antikorper, Anti- 
korperiragment, Interferon, Proteinhormon oder eine Protease ist. 
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Fig. 3 
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Fig. 4 
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Fig. 5 
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Fig. 6 
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Fig. 7 
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Fig. 8 
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